home *** CD-ROM | disk | FTP | other *** search
/ AmigActive 2 / AACD 2.iso / AACD / Magazine / Rebol / bbc_txt_2.r < prev    next >
Text File  |  1999-09-30  |  1KB  |  37 lines

  1. REBOL [
  2.   Title: "BBC News -- Headline Extractor #2"
  3.   Date:  28-September-1999
  4.   File:  %bbc_txt_2.r
  5.   Purpose: {
  6.       Download the BBC News page and form a digest file
  7.       of the headlines.
  8.       Also strips tags from text (such as the <B>..</B>).
  9.   }
  10. ]
  11.  
  12. ; Allow REBOL to write to the file without constant prompting
  13. ; (Run REBOL with -s option to avoid the prompt from this command, too)
  14. secure none
  15.  
  16. ; A function to do the tag stripping
  17. ; (The code is like one of the trivial examples)
  18. strip-tags: func [str /local lst txt]
  19.             [txt: make string! 10
  20.              lst: parse/all trim/lines str "<>"
  21.              forskip lst 2 [append txt first lst]
  22.              txt]
  23.  
  24. out: %digest.txt
  25. write out ""
  26. text: read http://news.bbc.co.uk/
  27. line: ["<TD" thru ">" any [newline | "<FONT" thru ">" | <B>]
  28.         ["<A" thru {">} any newline
  29.           [ "<IMG" | "<PARAM"
  30.           | copy item to "</A>" (write/append out rejoin [strip-tags item "^/"])]
  31.         | none]
  32.        thru </TD>] 
  33. parse text
  34.   [thru <!--******** "Todays date" component ******** -->
  35.    some [line | newline | thru <TR> | thru </HTML>]
  36.   ]
  37.